【新智元導讀】Google在2025年底甩出「王炸」:Gemini 3 Flash! 這款模型徹底打破了「快就一定笨、強就一定貴」的定律,以3倍於前代的速度實現「零延遲」響應,甚至在程式設計和邏輯推理上反超了Pro級大哥。Gemini 3 Flash正式發佈!至此,Gemini 3家族成為完全體:Flash、Pro和Deep Think。Flash模型已經全面上線Gemini APP、AI Studio、Google Antigravity和Gemini CLI,使用者打開Gemini就是默認Gemini 3 Flash版本,直接免費使用!如果說之前的AI模型是在模擬人類的思考,那麼Gemini 3 Flash就是在模擬人類的「直覺」。3倍於Gemini 2.5 Pro的速度,卻擁有超越Pro級的推理能力。這不僅僅是一次升級,這是對現有AI互動體驗的一次降維打擊!實測Gemini 3 Flash之後,只有一個感受:快!簡直太快了。速度快到「沒有載入條」,這種體驗簡直是「零延遲」的魔法,剛敲完回車,答案就已經在螢幕上渲染完畢。它不僅快得離譜,更可怕的是,它的智力竟然在某些領域直接「背刺」了自家的Pro大哥。通常「Flash」意味著「降智」,但這次不同。Gemini 3 Flash在某些複雜的Agentic Coding(智能體程式設計)任務上,甚至直接超越了Gemini 3 Pro!比如Flash在MMMU Pro(多模態理解和推理)上取得了81.2%,反超Gemini 3 Pro的81.0%,要知道從API成本來看,相比Gemini 3 Pro,Flash成本直接砍到了四分之一。更便宜,但是性能反而不降反升!估計今夜Google又讓整個大模型行業「集體失眠」了。拳打Claude,腳踢GPT在Artificial Analysis的最新評估中,3 Flash相比上一代2.5 Flash直接來一次質變飛躍,這應該是2025年同個系列模型的最大跨度升級!很難想像,一個Flash輕量級模型能夠超過Cladue的旗艦模型Opus 4.5。(估計相比OpenAI,Anthropic對一個坐不住了)。其他指標,Flash也達到了最頂級模型的水平。Flash在GPQA Diamond(90.4%)和Humanity’s Last Exam(無工具列件下33.7%)等博士級推理和知識基準測試中展現了前沿性能,足以媲美更大的前沿模型,並且在多項基準測試中顯著優於前代旗艦Gemini 2.5 Pro。在ARC-AGI Semi-Private Eval上,Gemini 3 Flash的表現同樣極具競爭力,且成本大幅低於其他前沿模型。ARC-AGI-1: 84.7%, $0.17/任務ARC-AGI-2: 33.6%, $0.23/任務在LMArena上,Gemini 3 Flash的文字能力直接躍升至第3!Gemini 3 Flash證明了速度和規模並不一定要以犧牲智能為代價。除了前沿級的推理和多模態能力外,Gemini 3 Flash專為高效而生,推動了質量與成本、速度之間的帕累托前沿(Pareto frontier)。在進行最高層級的思維處理時,Gemini 3 Flash能夠調節其「思考量」。對於更複雜的用例,它可能會思考更久,但在典型流量下,它平均比2.5 Pro少消耗30%的Token,卻能以更高的性能精準完成日常任務。Gemini 3 Flash的核心優勢在於其原生速度!它的表現優於2.5 Pro,但速度快了3倍(基於Artificial Analysis基準測試),而成本卻只是零頭。Gemini 3 Flash的定價為每百萬輸入Token 0.50美元,每百萬輸出Token 3美元(音訊輸入保持在每百萬輸入Token 1美元)。開發者新寵:極速與深度的完美平衡對於開發者來說,模型的響應速度是第一位。Gemini 3 Flash專為迭代開發打造,提供Gemini 3 Pro級的編碼性能和低延遲——它能夠在高頻工作流中快速推理並解決任務。在評估編碼智能體能力的SWE-bench Verified基準測試中,Gemini 3 Flash獲得了78%的分數,不僅超越了2.5系列,還超過了Gemini 3 Pro。可以說,它在智能體編碼、生產級系統和響應式互動應用之間實現了理想的平衡。與此同時,Gemini 3 Flash在推理、工具使用和多模態能力方面的強勁表現,非常適合希望進行更複雜的視訊分析、資料提取和視覺問答的開發者。這意味著它可以賦能那些景既需要極速響應,也需要深度推理的更智能的應用程式。比如,Gemini 3 Flash能在一款手部追蹤的「彈球益智遊戲」中實現多模態推理,提供近乎即時的AI輔助。或者,近乎即時地建構並A/B測試新的載入動畫設計,幫助簡化了從設計到程式碼的流程。以及,根據非常簡單的一段提示詞,編寫出三種獨特的設計變體。甚至,還能通過多模態推理分析圖像,並生成帶有上下文UI覆蓋層的字幕,來將靜態圖像轉化為互動體驗。全民AI時代:搜你想搜,做你想做Gemini 3 Flash現已成為Gemini App中的默認模型,取代了2.5 Flash。這意味著全球所有的Gemini使用者都將免費獲得Gemini 3的體驗,讓處理日常任務的能力得到重大升級。得益於Gemini 3 Flash驚人的多模態推理能力,你可以用它來幫助你更快地看、聽和理解任何類型的資訊。例如,你可以讓Gemini理解你的視訊和圖像,並在幾秒鐘內將這些內容轉化為有用且可執行的計畫。比如,它可以通過分析短影片的內容,來為你制定改善高爾夫揮桿動作的計畫。上傳一段音訊錄音,Gemini 3 Flash會識別你的知識盲區,建立一個定製測驗,並針對答案給出詳細解釋。此外,針對速度進行最佳化了的Gemini 3 Flash,還能在你畫草圖時就猜出你在畫什麼。或者,即便沒有任何程式設計知識,你也可以僅用語音從頭開始快速建構有趣、實用的App。只需隨時隨地口述給Gemini,它就能在幾分鐘內將你原本非結構化的想法轉化為功能完善的App。Gemini 3 Flash也開始作為搜尋中AI模式的默認模型推出,面向全球使用者開放。建立在Gemini 3 Pro的推理能力之上,採用Gemini 3 Flash的AI模式在解析問題的細微差別方面更加強大。它會考量你查詢的方方面面,提供深思熟慮、全面且視覺上易於消化的回答——並從全網提取即時的本地資訊和有用的連結。結果有效地結合了研究與即時行動:你能在獲得特定推薦的同時得到智能梳理的內容細分——一切都以搜尋的速度呈現。當處理涉及多重考量的複雜目標時,這一點尤為出色,比如試圖規劃一次說走就走的旅行,或快速學習複雜的教育概念。收官2025:留給對手的時間不多了Gemini 3 Flash的發佈傳遞了一個清晰的訊號:高性能AI不再昂貴,也不再遲鈍。Gemini 3 Flash的邏輯很簡單:比我聰明的沒我快,比我快的沒我聰明,關鍵是它們都比我貴。Google正在用極其激進的策略——頂級推理+極致速度+地板價格,試圖在2025年底收割戰場。對於普通使用者來說,Gemini App裡的對話將變得極其流暢;對於開發者來說,建構即時、複雜的AI應用不再是燒錢的夢想,因為API真的太便宜了。2025年是充滿挑戰的一年,AI真正邁入了一個新時代,模型不再只是演示品,而是被大規模使用的日用品。Google這一年並未追逐單一旗艦模型,他們推出了一系列產品陣容,而且每個模型都特別能打:追求速度,選Flash追求深度,選Pro追求推理,選Deep Think開啟「智能平權」時代Gemini 3 Flash發佈最大的顛覆之處還是在Agentic Coding等任務上超過Gemini 3 Pro。過去AI圈的邏輯是「大就是好」,但Gemini 3 Flash的意義在於它開啟了「智能平權」時代:徹底降維打擊低成本模型市場:在3 Flash出現之前,開發者在「便宜但笨」(如 GPT-4o-mini, 2.5 Flash)和「聰明但貴且慢」(如Pro)之間痛苦抉擇。Gemini 3 Flash把Pro級的智力拉到了Flash級的價格和速度,直接封死了競品低端模型的生存空間。為智能體時代鋪路:智能體工作的核心是「循環(Loop)」——思考、行動、觀察、再思考。如果模型太慢或太貴,這個循環就無法跑通。Flash極高的Token/秒/美元效率,是智能體能大規模商用的唯一基石。建構「延遲感」護城河:Google意識到,在搜尋和互動中,100ms的延遲差異比5%的精準度差異更能決定使用者留存。Flash的「瞬發」感讓它在AI搜尋模式下擁有了類似傳統搜尋的爽快感。現在的壓力,全部來到了OpenAI這邊。奧特曼,還坐得住嗎?是不是又要拉響紅色警報了~彩蛋目前來看,AI捲到Gemini 3 Flash這個程度感覺已經到頭了。我們試著用Gemin 3 Flash「套磁」了一下Gemini 4會在什麼時候推出,能夠達到什麼水平?還是有驚喜的。Gemini 4可能在2026年Google I/O大會推出(不過按照今年2.5的規律,大機率會是3.5)。而3 Flash給的另一點則更加有意義,如果說Gemini 3是推理和速度的完美極致,那麼下一代模型將聚焦於:智能體的主動性真正理解物理世界長程記憶以及超越人類的科學發現真是太期待明年的到來了!(新智元)